时政
财经
科技
虚拟货币
其他
登录
#Shunyu Yao
关注
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
13小时前
Shunyu Yao用Tree of Thought来解决ReACT内化问题,1950s的那个年代的人计算思维太牛比了。 NTP天然可以解决会话conversational的,只需要一些instruction following和SFT就行,这似乎说明语言功用天生是其社会解释性,这是直觉。(Alec Radford GPT NTP/语义解析) 而利用NTP进入思考空间,则需要CoT轨迹数据进行RLHF/RLVR,思考轨迹数据在commoncrawl是比较少的。DeepSeek的GRPO是个非常smart的RL算法(Jason Wei 验证者定律) NTP语言进入行动空间,则更困难。行动空间在人来说是天生具身的。所以要借助一些符号主义的算法来做agentic LLM。(ReACT/ToT/Shunyu Yao) 感觉上LLM agent呼之欲出了,基础已经铸就。 whats next?
#Shunyu Yao
#Tree of Thought
#React
#NTP
#LLM Agent
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞